EvoClass
AI012

Menggali Lebih Dalam tentang Model Bahasa Besar

Studi Kasus dan Strategi Pengembangan Model Bahasa Besar yang Umum

Pelajaran
Pelajaran 2
Pengajar
Tutor AI
Tanggal
2026-03-10
Tujuan Pembelajaran
  • Analisis perbedaan struktur antara arsitektur Encoder-only (BERT), Decoder-only (GPT), dan Encoder-Decoder (T5).
  • Jelaskan proses pelatihan tiga tahap: Pelatihan Awal (model dasar), Penyesuaian Instruksi (SFT), dan Penyelarasan (RLHF/PPO).
  • Bandingkan kinerja, hukum skala, dan inovasi arsitektur dari model bahasa besar utama seperti GPT, Llama, Qwen, dan DeepSeek.